排序方式: 共有105条查询结果,搜索用时 15 毫秒
51.
由于运动学的复杂性和环境的动态性,控制一组无人机遂行任务目前仍面临较大挑战。首先,以固定翼无人机为研究对象,考虑复杂动态环境的随机性和不确定性,提出了基于无模型深度强化学习的无人机编队协调控制方法。然后,为平衡探索和利用,将ε-greedy策略与模仿策略相结合,提出了ε-imitation动作选择策略;结合双重Q学习和竞争架构对DQN(Deep Q-Network)算法进行改进,提出了ID3QN(Imitative Dueling Double Deep Q-Network)算法以提高算法的学习效率。最后,构建高保真半实物仿真系统进行硬件在环仿真飞行实验,验证了所提算法的适应性和实用性。 相似文献
52.
53.
为了满足双马来酰亚胺树脂(BMI)应用于Z-pin高效拉挤的需求,要求其具有低黏度(500 ![]()
![]()
)、耐热(玻璃化转变温度大于200 ℃)、固化快以及韧性好等性能。使用TDE-85环氧树脂(EP)降低BMI黏度,并进一步加入改性剂提高树脂的耐热性和力学性能。分别采用黏度测试、差示扫描量热分析、热重分析、力学性能测试等方法研究树脂固化工艺、固化反应动力学、耐热性以及基本力学性能,筛选最佳树脂体系制备Z-pin并进行性能测试与分析。研究结果表明:TDE-85环氧树脂的加入可以有效降低树脂体系的黏度,满足高效拉挤工艺性需求。加入改性剂二苯甲烷二异氰酸酯(MDI)提高了EP-BMI体系的韧性和耐热性,玻璃化转变温度为251 ℃,综合性能达到最优。浇铸体拉伸强度、冲击强度分别为66 MPa、21 kJ/m2,分别提高了38%、53%。Z-pin短梁剪强度为67 MPa,与基体结合强度为31.2 MPa。改性树脂体系充分满足Z-pin高效拉挤的工艺需求和性能要求,具有良好的工程应用价值。 相似文献
54.
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。 相似文献
55.
X-cor增强泡沫夹层结构力学性能试验 总被引:4,自引:0,他引:4
研究了碳纤维X-cor销钉增强泡沫夹层结构的常规力学性能。自行设计工艺,制造了X-cor增强泡沫夹层结构复合材料,并进行了多种材料/几何参数下的平压、三点弯曲和芯子剪切试验,得到了系列试验数据,并观察记录了较全面的结构破坏模式;倾斜的X-cor销钉对夹层结构性能的增强效果大大优于垂直销钉的增强效果,倾斜X-cor增强泡沫夹层结构的抗弯刚度和破坏载荷大幅提高;X-cor增强泡沫夹层结构在弯曲载荷下具有较强的二次承载能力;X-cor增强泡沫夹层结构在弯曲和剪切载荷下均呈现明显的渐进失效过程,在初始裂纹出现后,直到最终破坏发生还有较长的损伤扩展过程,这一过程是增强相限制芯材裂纹大规模扩展的结果,表明X-cor增强泡沫夹层结构在初始裂纹出现后还具有较强的持续承载能力。 相似文献
56.
57.
针对执行机构部分失效的速度时变导弹机动目标拦截问题,本文提出一种基于深度强化元学习和剩余飞行时间感知逻辑函数的攻击角度约束三维制导律。首先,采用基于模型的深度强化元学习方法,建立深度神经网络动力学模型;引入模型预测路径积分控制,该深度神经网络动力学模型作为预测模型;采用元学习方法,在线学习执行机构部分失效及目标机动等环境变化。其次,提出基于偏态分布的采样方法,提升模型预测路径积分控制的采样效率。再次,在制导律的指标函数设计中提出一种逻辑函数,降低了制导初始阶段的加速度,提升了末速度。最后,多种情况下的仿真结果及蒙特卡洛仿真校验了方法在提升采样效率与降低初始阶段加速度的有效性。 相似文献
58.
空间飞行器在太空飞行过程中需要满足多任务、多工作模式以及大范围机动的需求, 其控制系统在大范围机动飞行条件下存在大量的外界干扰和内部参数不确定,同时飞行器的自适应过程受限于资源,人工干预难度大,并且现有的成熟的动态自适应方法并不一定适合空间飞行器控制软件进行自主控制,所以目前对自主控制系统软件的动态自适应调整方法提出了更高的要求.由此提出一种在双层感知—分析—决策—执行(MAPE)控制循环基础上的自适应框架,使用基于规则/策略的决策方法和基于强化学习的决策方法对系统感知到的局部和全局变化进行决策,并且采用基于数据驱动的反馈方法对规则库中的策略信息进行周期性的调整和优化,保证飞行器在太空执行任务面对复杂的环境时可以动态的完成自适应调整,保障任务的可靠执行. 相似文献
59.
高比例SiCp/Al复合材料热膨胀系数的研究 总被引:2,自引:0,他引:2
通过无压渗透法工艺 ,选用不同颗粒度 ( 70 #,10 0 #,15 0 #,180 #) ,不同颗粒形状 (不规则多边形 ,近球形 )的SiC ,制备了不同基体材料 (纯铝 ,ZL10 1,ZL3 0 1)的复合材料试样 ,并用云栅干涉法对各试样的膨胀系数进行了测定。结果表明 :SiCp Al的膨胀系数随颗粒尺寸的增大而下降 ,近球形颗粒增强复合材料的膨胀系数比不规则多边形要小 ,不同基体材料的复合材料的膨胀系数按着ZL10 1,纯铝 ,ZL3 0 1的顺序增大 相似文献
60.
面对未来有/无人机协同作战场景,实时准确的空战决策是制胜的关键。复杂的空中环境、瞬变的态势数据以及多重繁琐的作战任务,使有/无人机协同作战将替代单机作战成为未来空战的发展趋势,但多智能体建模和训练过程却面临奖励分配困难、网络难收敛的问题。针对5v5 有/无人机协同的空战场景,抽象出有人机和无人机智能体的特征模型,提出基于近端策略优化算法的空战智能决策算法,通过设置态势评估奖励引导空战过程中有/无人机智能体的决策行为向有利态势发展,实现在与环境的实时交互中,输出空战决策序列。通过仿真实验对所提空战决策算法进行验证,结果表明:本文提出的算法在经过训练学习后,能够适应复杂的战场态势,在连续动作空间中得到稳定合理的决策策略。 相似文献